智能论文笔记

Being Automated or Not? Risk Identification of Occupations with Graph Neural Networks

Dawei Xu , Haoran Yang , Marian-Andrei Rizoiu , Guandong Xu

分类：神经与进化计算

2022-09-06

自动化技术（例如人工智能（AI）和机器人技术）的快速进步构成了越来越多的职业自动化风险，可能会对劳动力市场产生重大影响。最近的社会经济研究表明，接下来的十年中，将近50％的职业处于自动化的高风险。但是，缺乏颗粒状数据和经验知情的模型限制了这些研究的准确性，并使预测哪些工作将是自动化的。在本文中，我们通过在自动化和非自动化职业之间执行分类任务来研究职业的自动化风险。可用信息是由标准职业分类（SOC）分类的910个职业的任务声明，技能和互动。要充分利用此信息，我们提出了一个基于图的半监督分类方法，名为\ textbf {a} utomated \ textbf {o} ccupation \ textbf {c}基于\ textbf {g} rassification \ textbf {n} etworks（\ textbf {aoc-gcn}）识别职业的自动化风险。该模型集成了一个异质图，以捕获职业的本地和全球环境。结果表明，我们提出的方法通过考虑职业的内部特征及其外部互动的信息来优于基线模型。这项研究可以帮助决策者在进入就业市场之前确定潜在的自动化职业并支持个人的决策。

translated by 谷歌翻译

自动识别仇恨和虐待内容对于打击有害在线内容及其破坏性影响的传播至关重要。大多数现有作品通过检查仇恨语音数据集中的火车测试拆分上的概括错误来评估模型。这些数据集通常在其定义和标记标准上有所不同，从而在预测新的域和数据集时会导致模型性能差。在这项工作中，我们提出了一种新的多任务学习（MTL）管道，该管道利用MTL在多个仇恨语音数据集中同时训练，以构建一个更包含的分类模型。我们通过采用保留的方案来模拟对新的未见数据集的评估，在该方案中，我们从培训中省略了目标数据集并在其他数据集中共同培训。我们的结果始终优于现有工作的大量样本。当在预测以前看不见的数据集时，在检查火车测试拆分中的概括误差和实质性改进时，我们会表现出强烈的结果。此外，我们组装了一个新颖的数据集，称为Pubfigs，重点是美国公共政治人物的问题。我们在PubFigs的305,235美元推文中自动发现有问题的语音，并发现了对公众人物的发布行为的见解。

translated by 谷歌翻译

近年来，在我们称之为社交媒体的意见生态系统中，极端主义观点的兴起。允许在线极端主义坚持会带来可怕的社会后果，并不断探索减轻它的努力。积极的干预措施，受控信号，以提高某些意见的目的增加了对意见生态系统的关注，这就是缓解途径的一种途径。这项工作提出了一个平台，通过意见市场模型（OMM）测试积极干预措施的有效性，这是一个在线意见生态系统的两层模型，共同考虑了开幕式的相互作用和积极干预的作用。第一层使用多元离散时间霍克斯流程模拟了意见注意市场的规模；第二层利用市场份额吸引模型来模拟合作的意见并竞争市场份额，但注意力有限。在合成数据集上，我们显示了我们提出的估计方案的收敛性。在Facebook和Twitter讨论的数据集中，其中包含有关丛林大火和气候变化的中等和极右翼意见，我们在最先进的表现以及揭示潜在意见互动的能力上表现出了优越的预测性能。最后，我们使用OMM来证明主流媒体报道的有效性是抑制极右翼意见的积极干预措施。

translated by 谷歌翻译

这项工作引入了一种新颖的多变量时间点过程，部分均值行为泊松（PMBP）过程，可以利用以将多变量霍克斯过程适合部分间隔删除的数据，该数据包括在尺寸和间隔子集上的事件时间戳的混合中组成的数据。 - 委员会互补尺寸的事件计数。首先，我们通过其条件强度定义PMBP过程，并导出子临界性的规律性条件。我们展示了鹰过程和MBP过程（Rizoiu等人）是PMBP过程的特殊情况。其次，我们提供了能够计算PMBP过程的条件强度和采样事件历史的数字方案。第三，我们通过使用合成和现实世界数据集来证明PMBP过程的适用性：我们测试PMBP过程的能力，以恢复多变量霍克参数给出鹰过程的样本事件历史。接下来，我们在YouTube流行预测任务上评估PMBP过程，并表明它优于当前最先进的鹰强度过程（Rizoiu等人。（2017b））。最后，在Covid19的策划数据集上，关于国家样本的Covid19每日案例计数和Covid19相关的新闻文章，我们展示了PMBP拟合参数上的聚类使各国的分类能够分类案件和新闻的国家级互动报告。

translated by 谷歌翻译